深入分析Kotlin的属性代理机制
今日科技快讯
近日,据The Verge报道,芯片制造商英特尔公司不久前宣布将退出了移动5G市场,现在该公司首席执行官鲍勃·斯旺给出了解释,即苹果和高通的意外和解促使他们退出移动5G领域的竞争。
作者简介
明天就是五一小长假了,今年的五一假期会放4天假,希望大家都可以利用好好放松一下,我们5月5号再见,祝大家五一快乐!
本篇文章来自 小小小小小粽子 的投稿,分享了他对属性代理的理解,相信会对大家有所帮助!同时也感谢作者贡献的精彩文章。
小小小小小粽子 的博客地址:
https://www.jianshu.com/u/e3e2429f26e8
前言
熟悉Kotlin的人可能知道,类代理是一种基于父类或者接口的实现,而在代理属性这边没有这种限制,而且这些代理对象的公共方法的参数中还包含了委托对象,这意味着在代理对象中也可以调用委托对象的公共方法。Kotlin的标准库中就包含了许多使用代理属性的实现,比如lazy。
正文
我们先来学习下写标准库的大佬怎么玩的,lazy的用法很简单:
val num by lazy {
BigInteger.valueOf(120).modPow(BigInteger.valueOf(120))
}
我们假设num的获取是耗时操作,而且我们还不一定要用到它,一个比较好的策略就是惰性求值,用到时再去获取,并把结果缓存起来避免重复的运算,提高代码的性能,lazy提供的就是这样一种机制。
public actual fun <T> lazy(initializer: () -> T): Lazy<T> = SynchronizedLazyImpl(initializer)
这里是一个高阶函数,接受一个lambda作为参数,返回了一个SynchronizedLazyImpl的对象,现在还看不出是什么东西,我们再往里面看:
private class SynchronizedLazyImpl<out T>(initializer: () -> T, lock: Any? = null) : Lazy<T>, Serializable {
private var initializer: (() -> T)? = initializer
private var _value: Any? = UNINITIALIZED_VALUE
// final field is required to enable safe publication of constructed instance
private val lock = lock ?: this
override val value: T
get() {
val _v1 = _value
if (_v1 !== UNINITIALIZED_VALUE) {
return _v1 as T
}
return synchronized(lock) {
val _v2 = _value
if (_v2 !== UNINITIALIZED_VALUE) {
(_v2 as T)
} else {
val typedValue = initializer!!()
_value = typedValue
initializer = null
typedValue
}
}
}
override fun isInitialized(): Boolean = _value !== UNINITIALIZED_VALUE
override fun toString(): String = if (isInitialized()) value.toString() else "Lazy value not initialized yet."
private fun writeReplace(): Any = InitializedLazyImpl(value)
}
哦,这是一个实现了Lazy接口的类,我们可以看到,value的get方法使用了synchronized关键字来确保线程安全,我们传入的lambda会在这里被调用计算出一个结果,然后结果被缓存在_value中,下次再访问就不会重新计算结果了。
而Lazy的结构如下:
public interface Lazy<out T> {
public val value: T
public fun isInitialized(): Boolean
}
结构很简单,没什么东西,我们再回到lazy函数的重载方法:
public actual fun <T> lazy(mode: LazyThreadSafetyMode, initializer: () -> T): Lazy<T> =
when (mode) {
LazyThreadSafetyMode.SYNCHRONIZED -> SynchronizedLazyImpl(initializer)
LazyThreadSafetyMode.PUBLICATION -> SafePublicationLazyImpl(initializer)
LazyThreadSafetyMode.NONE -> UnsafeLazyImpl(initializer)
}
哦哟,使用这个方法我们可以显式指定一个LazyThreadSafetyMode,从名字上看它跟线程安全有关系,而且每个模式都使用了不同的Lazy实现,除了我们刚刚讨论的SynchronizedLazyImpl,还有其它一些。
先来看LazyThreadSafetyMode,这是一个枚举类,支持三种模式:
SYNCHRONIZED 使用锁来确保只有一个线程来求值。
PUBLICATION 允许多个线程来初始化值,但是只有第一个返回的值有效。
NONE 允许多个线程来初始化值,但是行为就不确定了。
意思就是我们的app运行在单线程里我们就可以直接把mode传为NONE啰,避免加锁带来的开销呗,那在Android开发过程中,我们可以这么用:
private val rv by lazy(LazyThreadSafetyMode.NONE) {
findViewById<RecyclerView>(R.id.rv)
}
因为系统只会在UI线程上操作UI,所以我们不需要担心有什么并发访问,稍加包装我们甚至可以自己实现一个KotterKnife。
再来看看None模式下使用的UnsafeLazyImpl:
internal class UnsafeLazyImpl<out T>(initializer: () -> T) : Lazy<T>, Serializable {
private var initializer: (() -> T)? = initializer
private var _value: Any? = UNINITIALIZED_VALUE
override val value: T
get() {
if (_value === UNINITIALIZED_VALUE) {
_value = initializer!!()
initializer = null
}
return _value as T
}
override fun isInitialized(): Boolean = _value !== UNINITIALIZED_VALUE
override fun toString(): String = if (isInitialized()) value.toString() else "Lazy value not initialized yet." private fun writeReplace(): Any = InitializedLazyImpl(value)
}
还是主要看value的get方法,我们可以看到,get方法只会检查value有没有被赋值,然后计算出一个结果或者返回缓存的值,但是这里并没有加锁,就不会保证线程安全,常见的并发问题都有可能在这里发生。
最后到了PUBLICATION,它也允许多线程访问,但是跟NONE有些微妙的差别,来看一个小例子,来帮我们理解PUBLICATION的行为:
class CacheThread(val lazyValue: BigInteger) : Thread() {
override fun run() {
super.run()
Thread.sleep(250)
println("${this::class.java.simpleName} $lazyValue")
}
}
class NetworkThread(val lazyValue: BigInteger) : Thread() {
override fun run() {
super.run()
Thread.sleep(300)
println("${this::class.java.simpleName} $lazyValue")
}
}
我们模拟了两个线程执行耗时操作,一个取缓存,一个取网络数据,他们都需要一些时间来执行操作。
这是我们的测试代码:
fun main(args: Array<String>) {
val lazyValue by lazy(LazyThreadSafetyMode.PUBLICATION) {
println("computation")
BigInteger.valueOf(2).modPow(
BigInteger.valueOf(7),
BigInteger.valueOf(20)
)
}
CacheThread(lazyValue).start()
NetworkThread(lazyValue).start()
}
结果如下:
computation
CacheThread 8
NetworkThread 8
我们可以发现,值只被计算了一次,当CacheThread引用了lazyValue之后,结果就被缓存了下来,后面线程再访问都是访问的这个缓存的值,不会再重新计算了。
它是怎么做的呢:
private class SafePublicationLazyImpl<out T>(initializer: () -> T) : Lazy<T>, Serializable {
private var initializer: (() -> T)? = initializer
private var _value: Any? = UNINITIALIZED_VALUE
// this final field is required to enable safe publication of constructed instance
private val final: Any = UNINITIALIZED_VALUE
override val value: T
get() {
val value = _value
if (value !== UNINITIALIZED_VALUE) {
("UNCHECKED_CAST")
return value as T
}
val initializerValue = initializer
// if we see null in initializer here, it means that the value is already set by another thread
if (initializerValue != null) {
val newValue = initializerValue()
if (valueUpdater.compareAndSet(this, UNINITIALIZED_VALUE, newValue)) {
initializer = null
return newValue
}
}
("UNCHECKED_CAST")
return _value as T
}
override fun isInitialized(): Boolean = _value !== UNINITIALIZED_VALUE
override fun toString(): String = if (isInitialized()) value.toString() else "Lazy value not initialized yet." private fun writeReplace(): Any = InitializedLazyImpl(value)
companion object {
private val valueUpdater = java.util.concurrent.atomic.AtomicReferenceFieldUpdater.newUpdater(
SafePublicationLazyImpl::class.java,
Any::class.java,
"_value"
)
}
}
我们看到这里在调用了initializer之后就把就把它置为空了,确保它只执行一次,然后使用java.util.concurrent.atomic.AtomicReferenceFieldUpdater.newUpdater来更新_value的值,这就保证了第一次计算出的结果会被成功保存下来。
好了,到这里我们算是弄清楚三种模式的行为了,知道它们用什么策略来获取一个结果,接下来就要找哪里用到了这三个类的value字段,把这个value返回给我们的委托对象的。
鉴于我之前在文章里都有告诉大家编译器会悄咪咪帮我们做事,减少我们的工作量,我猜这次也不例外,还是写个最简单的例子,从字节码入手:
fun main() {
val lazyValue by lazy { 1 }
print(lazyValue)
}
主要看字节码:
// access flags 0x11
public final main()V
L0
LINENUMBER 3 L0
GETSTATIC Main$main$lazyValue$2.INSTANCE : LMain$main$lazyValue$2;
CHECKCAST kotlin/jvm/functions/Function0
INVOKESTATIC kotlin/LazyKt.lazy (Lkotlin/jvm/functions/Function0;)Lkotlin/Lazy;
GETSTATIC Main.$$delegatedProperties : [Lkotlin/reflect/KProperty;
ICONST_0
AALOAD
ASTORE 2
ASTORE 1
L1
LINENUMBER 4 L1
ALOAD 1
ASTORE 3
ACONST_NULL
ASTORE 4
L2
ALOAD 3
INVOKEINTERFACE kotlin/Lazy.getValue ()Ljava/lang/Object; (itf)
L3
CHECKCAST java/lang/Number
INVOKEVIRTUAL java/lang/Number.intValue ()I
ISTORE 3
L4
LINENUMBER 4 L4
L5
GETSTATIC java/lang/System.out : Ljava/io/PrintStream;
ILOAD 3
INVOKEVIRTUAL java/io/PrintStream.print (I)V
L6
L7
LINENUMBER 5 L7
RETURN
L8
LOCALVARIABLE lazyValue Lkotlin/Lazy; L1 L8 1
LOCALVARIABLE this LMain; L0 L8 0
MAXSTACK = 3
MAXLOCALS = 5
我们可以看到我们在打印时调用了Lazy的getValue方法。
我们就来找一找它,很巧,在这个枚举类上面,相同的文件下(Lazy.kt),包含了一个叫getValue的扩展方法:
/**
* An extension to delegate a read-only property of type [T] to an instance of [Lazy].
*
* This extension allows to use instances of Lazy for property delegation:
* `val property: String by lazy { initializer }`
*/
.internal.InlineOnly
public inline operator fun <T> Lazy<T>.getValue(thisRef: Any?, property: KProperty<*>): T = value
虽然这个方法看起来很奇怪,不过这下就很明了了,我们使用属性的时候是调用了这个方法,它直接使用了Lazy接口的value值,也就是我们刚刚分析的三个类中产生的value值,注意,它被operator修饰了,这代表着我们不一定要通过方法名来调用它。
结合前面的源码分析,我们可以稍做总结,Lazy对象确实做到了惰性求值,在我们访问属性,间接调用了getValue方法的时候才根据有无缓存的值来判断是否要计算结果。
目前看来,这里就是奥妙所在,而且从注释来看跟by关键字配合起来实现的黑魔法。按照套路总得有个规范是实现特定的功能,我们目前了解的公共的东西怕是也只有Lazy接口了,那kotlin是靠Lazy接口来创建代理属性的吗?再继续追究下去,我们就得先说说如何创建一个代理属性了。
一般来说,对于一个用val声明的属性,需要一个包含get方法的代理,而对于用var声明的,则get,set都需要有,根据文档我们要实现ReadWriteProperty或者ReadOnlyProperty接口,认真看的同学可能要问了,不对呀,我们刚刚看的Lazy系列都没有实现这些接口呀,怎么能够实现代理功能的?别急,即将揭晓,我们往下看:
/**
* Base interface that can be used for implementing property delegates of read-only properties.
*
* This is provided only for convenience; you don't have to extend this interface
* as long as your property delegate has methods with the same signatures.
*
* @param R the type of object which owns the delegated property.
* @param T the type of the property value.
*/
public interface ReadOnlyProperty<in R, out T> {
/**
* Returns the value of the property for the given object.
* @param thisRef the object for which the value is requested.
* @param property the metadata for the property.
* @return the property value.
*/
public operator fun getValue(thisRef: R, property: KProperty<*>): T
}
/**
* Base interface that can be used for implementing property delegates of read-write properties.
*
* This is provided only for convenience; you don't have to extend this interface
* as long as your property delegate has methods with the same signatures.
*
* @param R the type of object which owns the delegated property.
* @param T the type of the property value.
*/
public interface ReadWriteProperty<in R, T> {
/**
* Returns the value of the property for the given object.
* @param thisRef the object for which the value is requested.
* @param property the metadata for the property.
* @return the property value.
*/
public operator fun getValue(thisRef: R, property: KProperty<*>): T
/**
* Sets the value of the property for the given object.
* @param thisRef the object for which the value is requested.
* @param property the metadata for the property.
* @param value the value to set.
*/
public operator fun setValue(thisRef: R, property: KProperty<*>, value: T)
}
很巧,都包含了一个跟前面我们找到的Lazy相似的getValue方法,但是稍微看一下注释就发现其实并不是巧合,接口不是必须的,只要我们的类包含跟这些接口中的方法相同签名的方法,就可以实现属性代理的功能,那这样说我们也就豁然开朗了,怪不得要给我们的Lazy接口增加一个签名这么奇怪的扩展方法,怪不得Lazy的子类都能用作属性代理。
我是觉得实现接口可以避免我们方法签名写错,毕竟这方法又长又奇怪,而且实现起来也很简单:
class MyDelegate<T> : ReadWriteProperty<Any?, T?> {
private var value: T? = null
override fun getValue(thisRef: Any?, property: KProperty<*>): T? {
value
}
override fun setValue(thisRef: Any?, property: KProperty<*>, value: T?) {
this.value = value
}
}
这里我们直接返回了vaue,根据业务逻辑需求也可以在这里放复杂的逻辑。
使用起来就更简单了:
fun main(args: Array<String>) {
val value by MyDelegate<String>()
println(value)
}
到这里疑惑就都解开了,只要有一个符合特定条件的对象,这个对象的类不一定要实现特定的接口,只要包含了那些签名特殊的getValue,或者getValue,setValue方法都有,哪怕只是把这些方法声明成扩展方法也可以,那这个对象就能作为代理属性在by关键字后面使用。
另外,即使是局部变量也是可以使用代理属性的,不过需要注意的是,如果我们的代理会被局部变量使用,那第一个泛型参数要是可以为空的(Nullable),为什么呢,我们来看一下反编译的Java代码:
public final class MyDelegate implements ReadWriteProperty {
private Object value;
public Object getValue( Object thisRef, KProperty property) {
Intrinsics.checkParameterIsNotNull(property, "property");
Object var10000 = this.value;
return Unit.INSTANCE;
}
public void setValue( Object thisRef, KProperty property, Object value) {
Intrinsics.checkParameterIsNotNull(property, "property");
this.value = value;
}
}
public final void main( String[] args) {
Intrinsics.checkParameterIsNotNull(args, "args");
MyDelegate var10000 = new MyDelegate();
KProperty var3 = $$delegatedProperties[0];
MyDelegate value = var10000;
Object var4 = value.getValue((Object)null, var3);
System.out.println(var4);
}
我们发现对于本地变量value,getValue的第一个参数传的是null,因为本地变量不属于任何对象。
如果确定我们的代理只会被类的属性使用,那么我们就可以直接把第一个泛型参数传为不可空(NonNull)。
还没完,按照我之前讨论类代理的套路,我是要扒一扒使用多个代理的开销的,再来看一个例子,再添加一个使用相同代理的属性,
class Main {
val value by MyDelegate<String>()
val value1 by MyDelegate<String>()
}
这是反编译的java代码:
public final class Main {
// $FF: synthetic field
static final KProperty[] $$delegatedProperties = new KProperty[]{(KProperty)Reflection.property1(new PropertyReference1Impl(Reflection.getOrCreateKotlinClass(Main.class), "value", "getValue()Ljava/lang/String;")), (KProperty)Reflection.property1(new PropertyReference1Impl(Reflection.getOrCreateKotlinClass(Main.class), "value1", "getValue1()Ljava/lang/String;"))};
private final MyDelegate value$delegate = new MyDelegate();
private final MyDelegate value1$delegate = new MyDelegate();
public final String getValue() {
return (String)this.value$delegate.getValue(this, $$delegatedProperties[0]);
}
public final String getValue1() {
return (String)this.value1$delegate.getValue(this, $$delegatedProperties[1]);
}
}
我们可以看到,跟之前讲类代理的时候一样,每次使用代理都会单独创建一个代理对象,在这儿显然不是必须的,大家要有意识地减少开销,我们可以按照老套路把它声明成一个单例,至于如何声明也跟之前类代理的解决办法类似,这里就不再赘述了。
此外我还发现一个有意思的东西,我们的代理是支持泛型的,这意味着它可以用于任意类,比如这样:
class Main {
val value by MyDelegate<Int>()
val value1 by MyDelegate<Float>()
}
反编译成Java代码是这样的:
public final class Main {
// $FF: synthetic field
static final KProperty[] $$delegatedProperties = new KProperty[]{(KProperty)Reflection.property1(new PropertyReference1Impl(Reflection.getOrCreateKotlinClass(Main.class), "value", "getValue()Ljava/lang/Integer;")), (KProperty)Reflection.property1(new PropertyReference1Impl(Reflection.getOrCreateKotlinClass(Main.class), "value1", "getValue1()Ljava/lang/Float;"))};
private final MyDelegate value$delegate = new MyDelegate();
private final MyDelegate value1$delegate = new MyDelegate();
public final Integer getValue() {
return (Integer)this.value$delegate.getValue(this, $$delegatedProperties[0]);
}
public final Float getValue1() {
return (Float)this.value1$delegate.getValue(this, $$delegatedProperties[1]);
}
}
做了一些类型转换,这也是有开销的,而我在之前分析lambda的时候翻到过一个文件Ref.java,里面单独给原始类型创建了类,给其他类才提供了泛型版本:
public static final class ObjectRef<T> implements Serializable {
public T element;
public String toString() {
return String.valueOf(element);
}
}
public static final class ByteRef implements Serializable {
public byte element;
public String toString() {
return String.valueOf(element);
}
}
public static final class ShortRef implements Serializable {
public short element;
public String toString() {
return String.valueOf(element);
}
}
库作者为了避免类型转换带来的开销,特地加了这几个看起来冗余的类,我们这里也是可以效仿一下的嘛:
class IntDelegate : ReadOnlyProperty<Any?, Int?> {
override fun getValue(thisRef: Any?, property: KProperty<*>): Int? {
TODO()
}
}
总结
好了,经过这么一通硬核的分析,代理属性还能难得了谁?还是那句话哈,不一定是Kotlin比Java慢,可能是我们写的代码姿势不对优化不到位,大家平时学习的时候可以翻一翻源码,多看看字节码,多看看反编译的Java文件,比较比较,就能知道编译器为我们做了什么,即能加深对这些语法糖的理解,也能学到一些编码技巧。
推荐阅读:
欢迎关注我的公众号,学习技术或投稿
长按上图,识别图中二维码即可关注